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基于 Gabor 小 波 和 CNN 的 图 像 失真 类 型 判定 算法 


7ENSRE. R $4. KE 
(杭州 电子 科技 大 学 计算 机 学 院 , 杭州 310018) 


d X. 针对 图 像 失 真 分 类 问题 ， 提 出 了 一 种 基于 Gabor 小 波 和 CNN (convolutional neural network， 卷 积 神经 网 络 ) 
的 失真 类 型 判定 新 算法 。 该 算法 先 利 用 Gabor 小 波 的 良好 特性 对 图 像 进行 特征 粗 提取 ， 再 通过 改进 的 CNN 进一步 提 
取 关 键 特 征 。 算 法 步骤 包括 : 首先 对 图 像 进 行 预 处理 〈 包 括 标签 设 定 、 样 本 均衡 和 样本 扩充 ); 然后 对 预 处 理 后 的 图 像 
进行 8 方向 的 Gabor hk Eik, 并 将 不 同方 向 的 子 带 登 加 构成 输入 样本 ; 最 后 通过 自行 设计 的 CNN 和 Softmax 分 类 器 
对 样本 进行 训练 ， 训 练 的 过 程 中 采用 随机 梯度 下 降 和 反 向 误差 传播 的 方法 对 卷 积 核 参 数 进 行 优化 得 到 最 终 模型 。 利 用 
训练 好 的 模型 进行 失真 类 型 判定 实验 ， 在 LIVE 标准 图 像 库 上 分 类 正确 率 达 到 95.62%， 表 明 本 算法 具有 较 高 的 准确 性 
和 鲁 棒 性 。 

关键 词 : 卷 积 神经 网 络 ; Gabor 小 波 ; 失真 类 型 ; 特征 学 习 
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Image distortion judgement based on Gabor wavelet and CNN 


Li Pengcheng, Wu Tao, Zhang Shanging! 
(School of Computer Science & Technology, Hangzhou Dianzi University, Hangzhou 310018, China) 


Abstract: For image distortion classification, this paper proposes an algorithm based on Gabor wavelet and CNN 


(Convolutional Neural Network) . It uses the good characteristic of Gabor wavelet to extract rough feature of images firstly, 
© and then uses the improved CNN to extract the key feature from rough feature. The main steps include: Images are 
C preprocessed firstly (including labels setting, samples balance and samples expansion) ; Then it calculates eight directions 

Gabor wavelet to preprocessed images, and then add eight sub-bands to one sample for training; Finally, it uses a self-designed 

CNN and Softmax classifier to train the final model, and uses the methods of random gradient descent and error back 

propagation to optimize the parameters of convolution kernels during training. The final model is used to determine the type of 

image distortion, the classification accuracy on the LIVE standard image library is 95.62%, it shows that the proposed method 
has high accuracy and robustness. 


Key words: convolutional neural network; Gabor wavelet; image distortion type; feature learning 


间 有 的 差异 很 明显 ， 有 的 却 易 混 淆 。 因 此 ， 失 真 类 型 的 判定 成 
为 难点 之 一 。 为 了 解决 此 问题 ,已 有 学 者 提出 一 系列 失真 类 型 


里 和 传输 过 程 中 不 可 避免 的 会 出 现 。 ”区 分 的 方法 ， 其 大 致 可 分 为 两 类 : 第 一 类 通过 提取 图 像 空域 或 
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图 像 在 采集 、 压 缩 、 处 

各 种 类 型 和 程度 的 失真 。 这 不 仅 影响 视觉 体验 ， 而 且 很 有 可 能 频 域 的 特征 ， 然 后 利用 传统 的 机 器 学 习 方 法 进行 判定 ， 如 文献 
来 巨大 的 损失 。 因 此 ， 图 像 质 量 评 价 的 研究 越 来 越 受 到 人 们 错误 ! 未 找到 引用 源 。 第 二 类 是 基于 深度 学 习 的 方法 ， 如 文献 

的 重视 ， 特 别 是 图 像 不 同 失真 类 型 的 判定 以 及 针对 特定 失真 类 [7]。 

型 的 评价 算法 。 第 一 类 方法 最 常见 的 是 利用 图 像 的 NSS (natural scene 

前 ， 己 经 有 一 些 针 对 特定 失真 类 型 的 评价 算法 ， 如 针对 statistics， 自 然 场 景 统 计 ) 特征 。 图 像 的 NSS 特性 将 自然 图 像 

模糊 图 像 的 评价 算法 全 人 Wai 、 了 噪声 图 像 的 评价 ” 转 到 图 像 的 DCT 域 或 小 波 域 提取 特征 , 该 特征 用 相应 的 数学 统 

Bp jf FRURRASUSN. SRURRSSUSIE 。 在 使 用 这 些 算 法 前 ,要 先进 行 失 计 模 型 来 描述 ， 同 时 这 种 模型 的 参数 会 随 着 不 同 的 图 像 失 真 类 

类 型 的 判定 。 由 于 不 同 的 失真 类 型 有 不 同 的 特征 ， 这 些 特征 之 ”型 以 及 失真 程度 而 改变 和 fa 。 基 于 NSS 的 方法 主要 包括 
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BIQI 错误 ! 未 找到 引用 源 。 ; 


等 。BIQI 方法 首先 
传统 机 


器 学 习 的 方法 进行 失真 类 型 


失真 图 


， 然 后 利 月 


用 源 。 和 BRISQUE 错误 ! 未 找到 引用 源 。 
图 像 小 波 域 的 统计 特征 ,然后 
分 类 。DIVINE 方法 首先 对 
日 图 像 的 NSS 特性 


拟 合 混合 高 
征 对 图 像 的 失 
的 NSS fi 


类 。 


第 二 类 方法 
习 ， 深 度 学 习 更 能 提高 
源 ,中 ,Hou 等 人 将 含 
network) H Æ K 


WR CS SAUEN ZE 


FE， 最 后 利用 SVM 分 类 器 对 


于 深度 学 习 的 方法 。 相 比 于 
评价 的 精度 。 例 如 文 南 


像 的 特征 ， 最 后 利用 这 些 
。BRISQUE 方法 首先 提 


图 像 的 失 


es 藏 层 的 深度 信念 网 络 (deep belief 


错误 ! 未 找到 引用 


。 作 者 在 文章 中 并 没有 使 / 


思想 对 医 


像 的 质量 进行 预测 ， 
般 ”“ 不 好 ”和 “很 差 ”， 
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像 的 质量 


用 深度 学 习 分 类 的 方法 ， 
» & 好 的 66 


寺 测 图 像 对 应 每 类 的 后 验 
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分 块 ， 


ITH. EXMP, BREH 


像 失真 程度 对 深度 学 习 网 络 进行 分 类 训练 的 方法 是 可 
民 等 首先 对 不 同 失真 类 型 的 区 


E^ HC. Nb 


些 图 像 块 进行 局 部 对 上 
好 的 CNN 进行 失真 类 型 判定 。 实 红 


a" 
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引用 源 。 p] 


好 的 效果 ， 但 准 


如 文献 [7]， 
而 使 得 训练 样 
大 的 误差 。 

对 这 些 问 题 ， 本 文 提 


eo rao 
空间 。 总 的 来 说 ， 基 于 深 
度 学 习 的 方法 一 般 县 有 更 高 的 准确 率 , 但 已 有 的 深度 学 习 算 法 ， 
[类 型 类 内 失真 程度 跨度 较 大 ， 从 


化 ， 最 后 通过 
比方 法 在 LIVE 错误 ! 未 找到 


图 像 失真 类 


I 差异 大 于 类 间 的 差异 ， 最 终 导致 出 现 较 


出 一 种 基于 Gabor 小 波 和 CNN 的 


型 判定 算法 。 不 同 于 文献 [7]， 本 文 算 法 不 仅 对 村 


的 失 


型 进行 了 划分 ， 还 对 每 种 失真 类 型 按 图 


进行 了 再 次 分 类 。 为 了 更 好 对 恨 


像 特征 进行 粗 提取 ， 在 六 
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El 
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果 更 准 


1 ”判定 算法 


失真 类 型 关 
dj. 
变换 对 区 


样本 ; 


Ht 


本 均衡 和 样本 标签 设 定 等 ; 


RHET Gabor 小 波 变换 。 同 时 ， 本 文 使 用 了 不 同 的 CNN 
| 练 。 实 验 表明 改进 后 的 网 络 收敛 速度 更 快 ， 分 类 结 


个 步 又: a) 预 处 理 ， 
b)8 方向 的 Gabor 小 波 


言 写 分 解 ， 将 分 解 后 的 子 带 进行 合力 


本 进行 训 乡 
算法 的 流程 如 医 


m 
n 


通过 PM OMA Softmax 4] 2S SS JUR RU FÉ 
型 对 图 像 的 失真 类 型 进行 


mi, $ arcas pa CONAI ERIT | 


1.1 样本 预 处 理 


1.1.1 样本 扩充 


在 图 像 训练 之 
进行 了 分 块 处 理 ， 
的 图 像 块 ， 每 个 图 


前 ,为 了 尽量 


像 块 作为 一 个 图 像样 本 ，N É 


E 


卷 积 神经 网 络 


图 1 算法 流程 


村 加 后 的 图 像 


兽 加 样本 的 数量 ， 对 所 有 样本 
体操 作为 : 将 一 张 图 像 可 重 装 地 分 为 NxN 


(CRESCE 


的 步 长 通过 实验 得 到 。 为 了 保证 正确 性 ， 还 对 背景 虚幻 的 图 像 


做 了 剪 切 处 理 ， 如 图 2 所 示 。 


1.1.2 样本 均衡 化 


致 最 终 分 类 结果 


由 于 不 同类 史 


m> 六 


pelV212, A2] 。 


1 的 样本 数量 可 能 
~ (E 


42. 背景 虚 化 图 像 裁剪 处 理 


分 布 不 均匀 ， 这 种 情况 将 导 


确 。 为 了 使 不 同类 别 的 样本 数量 保持 均衡 ， 
对 一 些 图 像样 本 进行 仿 射 变换 。 均 衡 化 过 程 如 下 所 示 : 
a) 计算 各 类 样本 数量 之 间 的 比值 : 


中 : Na, Np 分 别 为 4 类 和 和 4。 类 的 样本 数量 。 
里 的 范围 时 ， 则 认为 术 


(1) 


当 该 值 在 一 个 
本 之 间 是 均衡 的 ， 该 值 的 合理 区 间 


pb) 如 果 2 值 不 在 合理 区 间 ， 则 需要 对 样本 进行 旋转 或 者 缩 


放 这 两 种 仿 射 变换 中 


1.1.3 样本 标签 设 定 


在 设置 标签 的 时 


每 种 失真 类 型 按照 失真 程度 进行 了 月 


直到 2 的 值 在 合理 的 区 间 为 止 。 


吴 除了 按照 不 同 失真 类 型 进行 设 定 ， 还 对 
了 分 类 。 例 如， 对 LIVE 图 


像 库 中 失真 类 型 为 高 


斯 模糊 (Gblur)〉 和 高 斯 


(WN) 的 


图 像 进 行 标签 设 定 的 流程 为 :首先 按照 失真 类 型 


分 为 两 类 ; 然 


后 再 将 这 些 图 像 的 DMOS (differential mean opinion score, 差异 


主观 分 数 ) 值 归 一 化 到 [0,1] 并 等 分 为 三 
幅 图 像 的 DMOS 值 所 在 区 间 的 位 置 再 分 类 , 具体 做 法 如 表 1 所 
示 。 这 样 进行 再 分 类 减 小 类 内 样本 之 间 的 差异 ， 


程 中 给 CNN 网 络 带 来 紊乱 ， 从 而 提高 准确 率 。 
表 1 不 同 程度 的 图 像样 本 标签 设 定 


个 区 间 ; 最 后 分 别 按照 每 


避免 训练 的 过 
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失真 好 的 中 等 很 差 
类 型 DMOS:0~0.3 DMOS:0.3~0.6 DMOS:0.6~1 
Gblur 


A 


1.2 Gabor 小 波 变换 


正式 训练 之 前 , 使 用 Gabor 小 波 对 样本 进行 变换 。Gabor 
小 波 不 同 于 其 他 小 波 ， 它 除了 能 得 到 图 像 的 频 域 信息 还 能 得 到 
图 像 的 时 域 信息 ， 选 用 它 的 原因 如 下 : a) Gabor 小 波 具 有 多 尺 
度 多 方向 的 选择 特性 ， 对 图 像 的 边缘 敏感 ， 对 光照 不 敏感 ， 


n 


合作 期 于 


Chi 
Aa, $: E Gabor 小 a CRIKVA ESETE ES 


的 失真 类 型 敏感 。 图 3 展示 了 不 同 失真 类 型 的 图 像 经 Gabor 小 
波 变 换 后 子 带 二 加 之 后 的 直方 图 表示 ， 其 中 的 数据 经 过 了 归 一 
化 。 从 直方 图 的 形状 可 以 看 出 , 不 同 的 失真 类 型 的 图 像 经 Gabor 
小 波 变换 后 直方 图 的 形状 大 不 一 样 ， 这 说 明 图 像 失 真 类 型 可 利 
用 Gabor 小 波 变换 进行 判定 。 

Gabor 小 波 变换 由 式 〈2) 来 表示 。 


1,0) 2 333 f Gs y 09. Gi D) Q) 


其 中 : fos» 是 进行 小 波 变换 的 原 图 像 ，x、y 为 图 像 中 像素 的 
位 置 ， 参 数 s t 为 滤波 器 中 元 素 的 位 置 ， P={01…P-1、 

4={01.…2-1 为 小 波 变换 的 尺度 和 方向 。 函 数 ws 00 为 
Gabor NIAE ER Pra 05») RO EE JEU, Ppa 05 3) 的 定义 和 求解 
过 程 可 参考 文献 错误 ! 未 找到 引用 源 。。 图 像 经 8 个 方向 上 的 卷 


此 具有 和 良好 的 光照 不 变 特 性 ; b) 2D-Gabor 小 波 变换 核 具 有 优 积 核 卷 积 之 后 产生 8 幅 不 同方 向 的 子 带 图 像 ， 然 后 通过 式 (3D 
良 的 空间 局 部 性 ,能够 提取 图 像 多 尺度 多 方向 的 局 部 结构 特征 ， 对 所 有 子 带 进行 琶 加 得 到 训练 样本 。 
与 人 眼 细胞 的 结构 和 功能 很 类 似 ; c) Gabor 小 波 变换 可 用 于 图 g- otlu tetho 3) 
像 特征 提取 ， 与 其 他 特征 提取 方法 相 比 ， 具 有 处 理 数 据 少 、 速 Q 
度 快 和 和 鲁 棒 性 好 等 特点 。 同 时 ， 图 像 小 波 域 的 NSS 特征 对 图 像 其 中 ns 为 第 i 个 方向 的 子 带 图 像 。 
att d | 
0.4 0.4 0.4 0.4 
0.2 N 0.2 2 | 0.2 
0 0 0 0 
0 0.05 01 0 0.05 01 0 0.05 01 0 0.05 041 
(a) Gblur (b) FF (c) JP2K (d) WN 
图 3 不 同 失真 图 像 及 经 过 Gabor MER T 58 DIE E75 FÉ Rs 
1.3 ”模型 的 设计 与 训练 1g PRAET 
swb- [1 Law assis +R (5) 
1.8.1 卷 积 神经 网 络 激活 函数 的 确定 maa : 
H ZINJ u fT h 9 这 会 产生 LEE NE 
于 使 用 了 Gabor 小 波 对 样本 进行 了 处 理 ， 这 会 产生 很 多 R-E woy © 


RRE. J TERERAA, ASEE, 
本 文 使 用 了 文献 错误 ! 未 找到 引用 源 。 中 LReL Cleaky rectified 
linear) 激活 函数 ， 如 式 4) 所 示 ， 其 是 ReLU 函数 
的 一 种 改进 版 〈 当 系数 ea=0 时 即 为 ReLU 函数 )。 这 种 改进 不 
仅 利于 稀疏 数据 的 处 理 ， 而 且 还 考虑 到 了 ReLU 函数 可 能 会 使 
得 某 些 神 经 元 长 期 处 于 未 激活 状态 的 不 足 。 


W'x, W'x»0 
h(x)= 
aW’ x,W" x<0 


RE w 为 权 值 ， a 为 接近 0 的 常数 ， 其 值 可 以 通 
过 实验 得 到 。 
1.3.2 卷 积 神经 网 络 卷 积 核 的 确定 

通过 最 小 化 网 络 损失 函数 LOW. b) 确定 卷 积 神经 网 络 中 的 
卷 积 核 的 权 值 向 量 ， 本 文 使 用 的 损失 函数 工 为 平方 损失 函数 ， 
加 入 了 正则 项 防止 过 拟 合 ， 有 具体 代价 函数 表示 如 下 : 


x 为 特征 值 ， 


其 中 : m REACHES. Y 为 预测 标签 ，4 为 权重 衰减 参数 ，RW) 
为 正则 化 项 ，1 为 隐 层 序号 ，i 为 每 个 隐 层 中 神经 元 的 序号 ，j 
表示 与 每 个 神经 元 链接 的 权 值 的 序号 。 

为 了 最 小 化 代价 函数 7(W,b)， 采 用 随机 梯度 下 降 法 和 反 向 
误差 传播 算法 进行 参数 更 新 ， 参 数 W 和 4。 按照 式 (7) 更 新 。 


0 
Wy =W? — "m, J(W,b) 


() 


D n 
b =b” -a azo JW, b) 


其 中 :4 是 学 习 速 率 , 用 于 控制 梯度 下 降 步 长 ,考虑 到 越 接近 最 
优 解 的 时 候 ， 梯 度 下 降 的 幅度 越 小 ， 将 国定 步 长 改 成 动态 变化 
步 长 ， 具 体 如 下 式 : 
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其 中 :上 标 1 为 迭代 数 ，J 为 代价 函数 的 值 。 另 外 ， 为 了 防止 过 
拟 合 ， 在 全 连接 层 还 使 用 了 Dropout 方法 。 该 方法 是 由 Hinton 
等 车 Ra 有 提出 的 ， 这 样 在 训练 的 过 程 中 以 一 定 的 概率 随机 
忽略 一 些 隐 层 神经 元 的 影响 。 
1.3.3 网 络 结构 

本 文 使 用 的 网 络 结构 如 图 4 所 示 。 


采样 块 图 像 


卷 积 层 1 


卷 积 层 3 


进 后 的 卷 积 神经 网 络 


卷 积 网 络 


共有 11 
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， 包 括 输入 层 、4 层 卷 积 层 ，4 层 池 


化 层 ， 全 连接 层 


和 输出 层 。 第 一 层 卷 积 层 采用 32 个 5x5 大 小 


的 单 通道 滤 》 


方法 进行 池 化 ， 
对 上 层 池 化 层 进 


个 64 通道 的 3x3 滤波 器 进 


利用 128 个 5x5 

方法 同上 。 全 连 
维 向 量 ， 然 后 

佳 的 特征 


特征 通过 Dropout 方法 


皮 器 对 输入 图 


向 量 ， 全 连接 层 还 包括 Dropout 


像 进行 卷 积 ， 然 后 采 :/ 
第 二 层 卷 积 层 采用 64 3x3 的 32 通道 滤波 器 
行 卷 积 ， 池 化 操作 同上 ， 第 三 层 卷 积 层 采用 32 
行 卷 积 ， 池 化 方法 同上 ， 第 四 层 是 
的 32 维 滤波 器 对 上 层 池 化 层 进行 卷 积 ， 池 化 
接 层 是 将 上 层 池 化 层 得 到 的 神经 元 首尾 连接 成 
跟 2048 个 全 连接 层 神 经 元 进行 计算 得 到 2048 
E, 该 层 是 将 2048 维 


进行 过 滤 得 到 最 后 的 特征 向 量 。 输 出 层 


] MaxPooling 


是 将 最 后 的 特征 


2 ”实验 结果 


2.1 
实验 环境 为 


向 量 通 过 Softmax 分 类 器 进行 分 类 。 


与 分 析 


实验 环境 与 样本 集 划分 


Intel® Core™ i5 CPU 2.80GHZ， 内 存 为 8G， 


操作 系统 为 64 位 Windows7 旗舰 版 ， 利 用 Python 3.6.1 软件 基 


于 TensorFlow1.2.1 框架 进行 实验 。 


类 型 为 高 斯 
声 (WN), 


模糊 


145、198 和 145 


三 个 部 分 : 训练 


二 


JPEG2000 压缩 (JP2K) 和 快速 衰退 瑞 利 通道 失真 
(FF) 等 图 像 作为 样本 ， 


于 训练 ，20% 用 于 


选取 了 LIVE 数据 库 中 失真 


(Gblur)、JEPG 压缩 失真 (JPEG)、 高 斯 白 噪 


它们 各 自 的 样本 数量 分 别 为 145、204、 
咒 。 在 正式 训练 之 前 ， 所 有 样本 被 随机 划分 为 
集 和 测试 集 。 本 文 将 所 有 样本 的 60% 
验证 ，20% 用 于 测试 。 


T 


EE a 


2.2 ”对 比 实验 与 分 析 


2.2.1 极端 样本 的 分 类 


为 了 验证 本 


们 失真 类 型 判定 
是 接近 无 失真 图 
从 本 文 算法 判定 
准确 的 分 类 ， 


进行 


ZV DMOS 值 ( 归 一 


结果 分 析 

算法 的 鲁 棒 性 ， 图 5 列 出 了 四 张 不 同 失真 类 型 
化 后 )。 表 2 列 出 了 不 同 算法 对 它 
的 结果 。 从 DMOS 值 可 看 出 这 四 张 图 像 的 质量 
像 的 ， 对 于 失真 类 型 人 眼 似 乎 很 难 区 分 ， 但 是 
结果 来 看 ， 所 提出 的 算法 对 这 些 失 真 程度 均 能 
而 且 还 能 给 出 图 像 大 概 失真 程度 。 相 反 ， 对 
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于 其 他 算法 ， 


为 了 


失真 类 型 


类 失真 图 


总 存在 一 些 错误 的 尖 
2.2.2 数据 库 整 体 比 较 
更 好 地 说 
图 6 所 示 的 混淆 矩阵 ， 该 矩阵 是 检测 LIVE B 
4 的 分 类 结果 。 
的 混淆 程度 ， 第 i 行 第 j 列 的 值 
像 的 概率 。 
有 较 大 程度 的 混 消 ， 


US 


判定 ， 


本 算法 的 准确 性 和 和 鲁 棒 性 ， 


从 和 矩阵 中 可 以 看 出 ， 


见 表 2。 


本 文 给 出 了 如 
像 库 中 所 有 图 像 


混 涌 矩阵 中 的 值 表示 不 同 失真 类 型 之 间 
代表 第 i 类 失真 图 像 被 分 为 第 j 
JP2K 失 


5 FF 失真 


JPEG 失真 与 JP2K 失真 有 


而 WN, Gblur 失真 和 


其 它 失 真 类 型 几乎 没 


来 看 ， 各 种 失真 类 
F JPEG, 


fik. ME 


定 程 度 的 混淆 。 


型 之 间 的 混淆 概率 都 比较 


WN 和 Gblur 失真 类 型 的 关 


DE. 


氏 ， 本 算法 较 适 用 


(a)Gblur 


FI ACT * 


(b)JJPEG 


(c)JP2K (d)WN 
图 5 不 同 失真 类 型 图 像 
表 2 图 5 图片 的 分 类 结果 (x: 错 误 , V :正确 ) 
编号 DMOS BIQI DIVINE BRISQUE 本 算法 
(a 0.2131 x 4 4 4 〈 好 的 ) 
(b) | 02555 4 x 4 J 〈 好 的 ) 
(c) | 0.1997 x x x V 〈 好 的 ) 
(d 0.2179 4 4 4 4 GFR) 
JP2K | 0.9030 00120 0.0000 0.0040 0.0810 
gi JPEG ERORE 0.0550 0.0000 0.0145 — 0.0000 
in WN ooo 0.0037 EE oo oo» 
S Gblur 0.0000 0.0000 | 0.0000 0.0060 
D FF 0.0860 0.0120 0.0140 0.8700 
JP2K JPEG WN Gblur FF 
真实 类 型 
x6 在 LIVE 数据 库 上 的 混淆 矩阵 
表 3 列 出 了 本 文 算法 与 其 他 算法 在 LIVE 数据 库 中 的 判定 
准确 率 ， 包 括 每 类 失真 检测 的 准确 率 和 整体 准确 率 。 从 表 中 可 
以 看 出 , 除了 WN 失真 检测 的 准确 率 要 稍 逊 于 其 它 几 种 方法 2 
外 ， 本 文 算 法 对 失真 类 型 判定 的 准确 率 都 要 好 于 其 它 算法 。 从 
整体 准确 率 来 看 ， 本 文 的 方法 优 于 其 他 方法 。 
表 3 各 类 算法 在 LIVE 数据 库 中 的 准确 率 (%) 
方法 JP2K JPEG WN Gblur FF 全 部 
BIQI 86.36 88.46 92.59 68.75 66.67 80.99 


录用 稿 


DIIVINE 80.00 80.09 100.00 90.00 73.40 $83.74 


BRISQUE 82.90 88.89 100.00 96.70 83.33 88.60 


文献 [7] 88.10 90.91 100.00 97.37 8400 92.22 
本 文 方法 90.30 95.50 99.63 9940 87.00 95.62 


23 ”参数 对 比 实 验 


本 算法 中 有 很 多 参数 , 为 了 更 好 地 确定 参数 的 值 , 在 LIVE 


数据 库 中 做 了 交叉 验证 实验 。 
2.3.1 数据 库 整 体 比 较 
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像 块 的 大 小 进行 了 实验 。 为 了 避免 样本 数量 不 均衡 ， 采 用 


为 了 找到 图 像 块 合适 的 尺寸 ， 使 用 控制 变量 法 ， 通 过 调整 


可 重 半 的 图 像 块 采样 方式 。 由 表 4 可 知 ， 当 块 的 大 小 为 64x64 


时 ， 本 文 算法 得 到 的 总 体 准确 率 最 高 。 


表 4 不 同 图 像 块 尺寸 的 总 体 分 类 准确 率 (%) 


块 的 尺寸 28 36 64 72 80 
准确 率 (%) 86.34 90.72 95.62 93.21 90.80 


2.3.2 采样 的 步 长 


当 图 像 块 大 小 为 64x64 时 ， 为 了 确定 最 合适 的 采样 步 长 ， 


进行 了 不 同 采样 步 长 的 实验 ， 如 图 7 所 示 。 图 中 的 横 坐 标 表 示 


采样 步 长 ， 纵 坐标 表示 总 体 准 确 率 。 从 图 中 的 曲线 走势 可 以 看 
出 当 采 样 的 步 长 为 32 时， 总体 准确 率 最 高 。 
2.3.3 卷 积 核 尺 寸 


了 


为 了 确定 卷 积 核 的 大 小 ， 再 次 使 用 控制 变量 法 进行 实验 。 


在 其 他 条 件 不 变 的 情况 下 ， 首 先 将 每 个 卷 积 核 都 设计 成 相同 的 
尺寸 3x3， 然 后 从 第 一 个 卷 积 核 开 始 通过 更 改 每 层 卷 积 核 的 大 
， 依 次 确定 每 个 卷 积 核 最 合适 的 尺寸 。 具 体 的 实验 结果 如 表 


N 


5 所 示 ， 表 中 用 黑体 标注 了 每 个 卷 积 核对 应 的 最 高 的 准确 率 。 


0.96 


0.94 
0.92 


0 10 20 30 40 50 60 70 
采样 步 长 


DS 


7 不 同 采样 步 长 对 应 的 总 体 准确 率 
5 不 同 尺寸 的 卷 积 核 得 到 的 总 体 准 确 率 (%) 


n 
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的 条 件 下 ， 通 过 调整 a 的 值 计 算 不 同 的 总 体 准 确 率 。 图 8 展示 

T a 的 值 及 其 对 应 的 总 体 准确 率 之 间 的 关系 。 由 图 8 可 知 ， 当 

a=0.004 时 ， 总 体 准 确 率 最 高 。 

2.4 运行 时 间 分 析 
为 了 与 其 他 方法 进行 比较 ， 表 6 列 出 了 本 文 算法 与 其 他 算 

法 的 运行 时 间 。 从 表 中 可 以 看 出 ， 本 文 算法 的 运行 速度 虽然 没 

^H BIQI 和 BRISQUE 快 ， 但 基本 上 可 以 达到 实时 判定 的 效果 。 


> 


0.958 
0.956 a=0.004 
Æ 0.954 
€ 0.952 
3Á 
0.95 
0.948 
0 0.002 0.004 0.006 0.008 0.01 
a 的 值 
8 Ig] a 对 应 的 总 体 准确 率 
表 6 运行 时 间 比 较 
方法 BIQI DIIVINE ”BRISQUE ”文献 [7] 本 文 


时 间 /s 1.2881 7.3802 0.41329 2.4194 1.5152 


卷 积 核 尺 寸 3*3 5*5 7*7 9*9 
卷 积 核 1 94.613 95.200 94.936 94.100 
卷 积 核 2 95.200 95.013 94.987 94.900 
卷 积 核 3 95.200 95.113 95.000 94.998 
卷 积 核 4 95.200 95.620 95.420 95.400 


从 表 中 可 以 看 出 ， 当 第 一 个 卷 积 核 为 5x5， 第 二 个 卷 积 核 


为 3x3， 第 三 卷 积 核 为 3x3， 第 四 个 卷 积 核 为 5x5 时 ， 整 体 准 
确 率 是 最 高 的 。 
2.3.4 LRel 激活 函数 中 系数 a 


S 


为 了 确定 激活 函数 中 的 常数 4 的 值 ， 在 保持 其 他 参数 一 致 


3 RA 


为 了 使 用 深度 学 习 的 方法 进行 图 像 失真 类 型 的 判定 ， 并 解 
决 已 往 方法 中 类 内 差异 大 于 类 间 差 异 的 问题 ， 本 文 提出 一 种 基 
于 Gabor 小 波 和 CNN 的 图 像 失真 类 型 判定 算法 。 该 算法 首先 
对 样本 进行 不 同方 向 的 Gabor 小 波 变 换 ， 对 变换 后 的 小 波 子 带 
进行 闪 加 作为 样本 ;然后 利用 自行 设计 的 CNN 对 麦 加 后 的 样 
本 进行 训练 ， 得 到 最 终 模 型 ， 最 后 ， 利 用 该 模型 对 图 像 进行 失 
真 类 型 判定 。 在 LIVE 图 像 库 上 进行 了 实验 ， 实 验 表 明 新 方法 
有 具 有 较 高 识别 率 。 
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